什么是“计算法学”?
The following article is from 法律思想 Author lawthinkers
法律思想新设原创栏目
1.核心内容:“对法理相关学问领域内的概念进行解释,呈现解释人对该概念的个人理解或认知”。
2.文章特质:
(1)个体性:解释之立场、视角、内容均为解释人个人学习、阅读之思考,因此文章依据固然有主观性,但并不代表解释将会是“任意的”。我们要求解释人对自己的解释立场做事先限定,文献依据进行充分列举。
(2)注重结构。本栏目期望解释人之思享能最大程度上便捷有效,因此要求解释结构清晰,所用语词简洁,避免概念叠造。
3.主要目标:尽可能高效率地传递概念认知与思想内容。
4.投稿信息:
文章格式请参考本文;概念选取范围暂无限制(法理、哲学、历史、社会学均可);解释正文字数请尽量控制于2000以内(导言、拓展等不计在内)。
投稿邮箱:lawthinkers@163.com
解释人丨许新冉
中国社会科学院大学硕士研究生
纵观人类思想史,每当一股有生命力的学术思潮诞生后,其往往一如洪水猛兽般渗透扩张乃至占领其他学科的领域。上世纪50年代,语言分析思潮对哈特法哲学理论的影响就是一例。近几十年来,随着人类快速进入信息时代,我们似乎可以在计算思维的泛化中再次窥见这一现象。法学自然也被这一冲击所裹挟,越来越多以计算为基础的新兴方法与工具被应用到法学研究中去。(有学者专门整理了计算方法在法学中的实践应用, 参见 Jens Frankenreiter and Michael A. Livermore, “Computational Methods in Legal Analysis” 16 Annual Review of Law and Social Science 39 (2020).)但想恰当把握这些变化则殊为不易:一方面,由于学者自身的理论旨趣、经验感知与价值预设不尽相同,会从多个维度来切入此轮冲击,于是诞生了诸如“信息法学”“计算法学”“数据法学”“未来法学”“人工智能法学”等看上去各异但内理紧密相连的概念;另一方面,由于技术的迅速发展变化,即便是同个概念,在不同时空下出现,对应的实指也可能完全不同。例如,“信息法学”在早期是指法律文献的电子化研究,但后来则指技术改造法律行业的研究。
许多学者会借助一种二分结构来描述信息时代与法律的交互,即科技影响法律(law by technology)和法律影响科技(law for technology)的划分。前者强调法律运作过程被信息化的改造,如智慧司法的推进、法律科技公司的兴起等;后者强调信息化模式中的新兴法律议题,如数据确权、算法规制、智能化系统产物的权属等。但诚如苏力所言,这种“XX的发展对法律有影响或需求,而法律又对XX有规制或调整作用”的套路表达“往往会使我们忘记考察我们所讨论的问题本身的特殊性。”毕竟,并非任一科技的发展都能引起人文社科学者的广泛关注。以计算思维为主导的数据科学和人工智能技术定然有其独特的一面,才能形成特定的交叉研究领域。因此要进一步梳理计算与法学产生交叉的历史过程,才能更好地理解这个过程。
一、背景:20 世纪以来法学与科学的发展
对议题源起的断代直接影响着对具体问题的阐释。我们可以将法与计算结合的构想上溯到启蒙时代的思想家(如霍布斯、莱布尼茨等),但彼时其只是将“社会本质之自然”视作一种应具有数学(尤其是几何学)、物理学性质的设计,还停留在理论层面。(一个常见的例证是把莱布尼茨视为“计算法学”的鼻祖。但一方面,这样做有把莱布尼茨思想窄化的风险,逻辑推理机主要是早期莱布尼茨的法哲学思想;其次,早期莱布尼茨对这个问题拟采取一种逻辑推理机器的解决方式,但这种思路恰恰与当下主流的人工智能方法,即基于统计的相似拟合,是背道而驰的。See Huntington Cairns, “Leibniz’s Theory of Law” 60 Harvard Law Review 200 (1946).)只有在20世纪中叶以后,随着算法算力的发展,才使得这些构想有了落地的可能。而当下主流的人工智能建构思路,恰与早期启蒙思想家的构想是背道而驰的。因此,理解计算思维与法学的结合不应当脱离于相应学科的演进历程而存在。
就法学来说,20世纪初,美国法学界掀起了法律现实主义和法律社会学运动的浪潮, 前者拒绝“形而上学的废话”,认为法学的重点是对法院将做什么的一种预测性的技术分析;后者则引入社会学的概念,如社会结构、社会分层和社会功能,来分析法律问题。这一进程使得社会学的研究方法逐渐被法律人所重视,法学开始从概念的天国走向世俗的门庭。与此同时,以美国为代表的社会学界也开始“逐渐接受经验实证主义(positivism)的科学观,并且尊崇自然科学的研究策略为理想‘典范’”。此类自然科学的研究范式进一步表现为两个层面:一是用数学工具来对微观社会切片进行研究,一切经济事实都要先变成数学符号然后进行数学推理,最终将社会事实化归到整个数学体系中去;二是重视实验法等自然科学方法,社会学研究方法越来越技术化。总之,20 世纪的法学研究引入了社会学范式,而社会学研究又开始大量模仿自然科学的方法。故而,借自然科学的方法来研究法律问题,可以说是学术发展之必然。
同样,20世纪以来,科学本身也在不断的转型。艾尔弗拉德(Alfred Nordmann)等人 用科学的“跨时代断裂”(epochal break)来形容这种变化,即科学不再是简单的对自然问题的解答,相反,越来越多需要科学去回应的问题恰恰源于科学本身的技术性应用,如全球变暖、化工污染等。故而,在理解现代科学时,更需要去理解社会、技术与“自然”要素之间的复杂互动。而当科学将研究视角从自然世界移向人类社会时,出现了两种路径,一是计算社会科学,该学科致力于通过大数据计算来挖掘社会运行的宏观规律;二是人工智能技术,其试图通过计算来模拟人脑的思维过程。按照乔菲-雷维利亚(Cioffi-Revilla)在世界上首本计算社会学教材《计算社会科学概述》(Introduction to Computational Social Science: Principles and Applications)中所言,计算范式(Computational Paradigm)是一种信息化的处理范式,其分为本体和方法两个层面:从本体论上看,计算社会科学强调信息处理的重要性,从信息处理的角度解释和理解个体、社会,以及二者的互动;从方法论上看,其强调通过形式化的计算、建模来理解社会的复杂性,具体包括社会模拟仿真、互联网社会实验、社会数据计算等。这也是国内对“计算+”学科的常见看法,即在传统学科的研究范式中,引入数据和模型计算为主导的思维和方法。在这个语境下,计算思维主要是指丰富的数据资源(即曾流行的“大数据”概念。但严格来说,“大数据”的核心不应是“大”,而是一种搜集和处理大型据集的能力,可以将其视为一种社会学意义上的技术和文化现象。大数据研究应被视为对传统社会科学研究方法的补充,而非方法论上的终结。See Danah Boyd and Kate Crawford, “Critical Question for Big Data: Provocations for a Cultural, Technological, and Scholarly Phenomenon” 15 Information, Communication & Society 662 (2012).)与先进的数据处理技术(往往是各类计量模型)。
而就人工智能来讲,其侧重于用数据和算法去模拟个体人的思维方式。依据具体的发展思路,可分为三派:符号主义(Symbolicis,又称“逻辑主义”)、 连接主义(Connectionism,又称“统计主义”)和行为主义(Actionism,又称“控制论学派”)。需补充的是,这是一种方法论上的分类,基于人工智能模型的底层运作逻辑而来,基本为主流计算机学者所认可(除细微的表述差别外)。另一种常见的分类是只区分符号主义与连接主义,这主要是因为行为主义更多解决的是智 能体和现实环境的互动问题,而前两者只聚焦于智能体本身。此分类可参见魏斌:《法律人工智能:科学 内涵、演化逻辑与趋势前瞻》。对于这三个流派及其代表技术,可参考下表:
表1:人工智能主要流派及代表技术一览
具体来说,符号主义认为人类认知思维的构成是逻辑符号和逻辑推理,因此要将人的思考过程形式化为符号、规则与运算规则,从而用计算机来模拟人的智能行为。其早期在数学定理证明上的成功使得其成为20世纪80年代的主流智能体建构思路。代表产物就是专家系统,即能从一组专门知识(如法学、医学)中推演出逻辑规则来回答相关问题的系统。但因为人的思维远非简单辑推理,而且很多如价值判断之类的信息难以符号化,这些缺陷使得专家系统在20世纪90代开始式微,并直接导致了人工智能发展的第二次寒冬。统计主义则主张智能的实现应模拟人类的生理结构,即人脑的神经网络连接。该学派最早起源1943年的形式化神经元模型(M-P模型),后续罗森布拉特(Rosenblatt)研发出感知器模型,但因其缺陷一度陷入低潮。直到1982年霍普菲尔网络、1986多层感知器等多个模型使得多层神经元的训练算法成为可能。而算法训练所需的原料是数据和算力,恰随着互联网的兴起(提供海量数据)和图形处理器的发展(算力更大的芯片)使得神经网络的发展进入了黄金期,带领人工智能走出了第二次寒冬,并成为当下的人工智能的主流方向。强化学习则是关注智能体和现实环境的互动,强调智能体如何适应外界环境。而人工智能领域的“计算”,主要讨论的是人类智能是否可以通过纯粹的数字计算加以复现。(这一问题是由卢卡斯与怀特围绕《心灵、机器与哥德尔》(Minds, Machines and Gödel)一文而产生的争 议而来。参见李建会等:《计算主义及其理论难题研究》,中国社会科学出版社 2016 年版,第 1-3 页。)综上,在计算思维介入社会科学研究中,存在多种理解方式。从研究对象上可以分为两类,对宏观社会规律的计算和对个体人思维模式的计算。针对具体思维模式的计算,又存在统计主义和符号主义两种方式,分别侧重概率拟合和逻辑推演。
二、计算与法学的多元结合
也正是因为计算本身的丰富内涵,尤其在具体模型算法上的变化,使得法学与计算交叉的相关文章显得零碎且不成体系。
例如,《人工智能与法律》(Artificial Intelligence and Law)杂志近期曾对其过往三十年的文章进行了回顾,以十年为分期讨论了具体的变化:首个十年是法律案例推理(Reasoning with Legal Cases)、法律知识表征 (Representating Legal Knowledge)、道义逻辑建模(Modelling of Deontic Concepts);第二个十年则开始关注人工智能的本体论(Ontology)、法律文档信息化(Legal XML)和对法律论证与推理的模拟;第三个十年主要关注机器学习的方法,如案件预测等。这些转变往往是随着技术热点的变化而变化,缺乏内在的联系。当然,这里的思路转换并不意味着传统方法被抛弃了,当代大型人工智能模型往往是各类技术的综合体。但人文社科的学者较难把握具体问题中方法重心偏移对价值预设、研究思路等问题的影响。See Michał Araszkiewicz, et al., “Thirty Years of Artificial Intelligence and Law: Overview” 30 Artificial Intelligence and Law 593 (2022).
就国内外的研究来看,似乎可以大体区分为以下几种类型的研究。首先是通过宏观计算追求社会规律的计量法学(Jurimetrics)。这一概念由里·洛文杰(Lee Loevinger)所提出,即“通过收集大样本数据,对具有数量变化关系的 法律现象进行计量研究的独立交叉学科。”国内“计算法学”这个概念的早期版本也侧重 于此点,即“计算法学是具有数量变化关系的法律现象作为研究的出发点,采用统计学、 现代数学、计算智能等技术方法对相关数据进行研究,旨在通过实证研究评估司法的实际效果,反思法律规范立法的合理性,探究法律规范与经济社会的内在关系。”无论是这个定义,还是与之关联的“法律统计学”(Legal Statistics)等概念,都透露出浓厚的社会实证法学思想的影响,而定量研究作为社会科学基本研究范式之一,其在中西方学术界和法学领域的历史其实相当深厚。
(至于Jurimetrics与Legal Statistics之间的关系,二者都需要建立模型,但最主要的区别在于对模型的理解:计量的重点在于,当无法进行实验时,如何解决模型的内生性问题,即如何通过观测到的数据正确识别模型中的系数并进行因果推断。参见[美]杰弗里·M. 伍德里奇:《计量经济学导论:现代观点》,张成思等译,中国人民大学出版社 2015 年版,第一章。)根据叶启政教授的考证,早在18世纪的欧洲就已开始使用量化的方式来对社会现象进 行研究,如孔多塞在法国大革命期间即使用数学模式来研究投票行为。到了20世纪,随着美国社会学越来越讲求“实用”,受自然科学的影响,统计量化方法在美国取得主导地位,其中自然包括对法律现象的研究,例如芝加哥大学的普里切特(Pritchett)通过构建计算模型分析 1937-1947 年美国最高法院的判决来研究法官政策偏好对判决结果的影响。在这样的知识背景下,“计量法学”的出现也就不足为奇了。国内法学界也有相关的研究基础,故同样基于量化数学思维的“计算法学”就借着“社会实证法学(计量法学)”出现在中国法学界的面前。但需要指出的是,尽管“计量”和“计算”在中文语境下可以让人展开丰富的联想,甚至可能被视为同义词,但是 Quantitative和 Computational并不完全在同一个纬度。“计量”所解决的主要问题是探求社会现象之间的因果联系,“计算”所解决的问题还包括通过数据与算法去模拟智能体的行动。从这个意义上说,“计量”的最终判断与执行权都在于人,而“计算”则是试图复刻出这样一个能判断与执行的“人”。不过,尽管二者存异,但因为计算机无法处理数字外的任何输入,所以需要我们要对社会现象进行测量与量化后才可建模推理,因此量化领域的相关研究可作他山之石以供参考。
这种模拟智能体决策的计算思维与法学的结合被称为Computational Law(也即国内计 算法学的后期版本)。这一概念是由斯坦福大学的迈克尔·吉勒赛瑞斯(Michael Genesereth) 所提出,其将计算法学视为法律信息学的分支,主要研究法律推理的自动化,落足点在于新技术对法律行业的改造。除此之外,尚有Computational Jurisprudence、Computing Law、 Computer Law 等表达,学界已有全面讨论,在此不作赘述。(参见熊明辉:《从法律计量学到法律信息学》,载《自然辩证法通讯》2020 年第 6 期。)但从相关讨论中不难发现,国外学者在论及计算法学时,往往将其作为法律信息学(Legal Informatics,德文Rechtsinformatik)的下位概念或与之相对的概念。按照新近的研究,法律信息学是指由“法律技术专家”这类新兴工程师作为主体,研究科学技术如何影响法律行业。(Daniel Martin Katz, Ron Dolin and Michael J. Bommarito eds., Legal Informatics, Cambridge University Press, 2021, pp. 1-5.)整体来说,国外的计算法学是在法律信息学基础上不断发展而来的一个新概念,更侧重技术对具体法律操作流程的改造,例如合同的自动化审查、自动生成等。
因而,如果用“计算法学”来统摄法与计算研究的话,其在不同时空下的面向是不同的,在国外早期,其指代的更多是法律自动化(即“信息法学”或“人工智能法学”);在国内早期是指法律量化研究(即“计量法学”或“法律统计学”);当下学界也纳入了法律对数据和算法的规制部分(即“数据法学”和“算法法”等)。
三、计算与法学交叉问题域的展开
那么,如何把握这种多元且复杂的概念交叉呢?笔者认为,与其早早定下一个新兴领域的边界,不如先采用一种务实的视角去收集整理该领域中涌现的、亟待解决的问题,采用一种“问题史的方法”。如此,在“计算”和“法学”的磨合中,“问题”作为穿梭不同领域的导游,将数据、代码、公式和法律活动串成一片“法与计算”的问题域,并可以通过对某些核心问题的把握与反思,逐渐沉淀出“法与计算”交叉研究的疆域。
就核心问题而言,计算法学肇始于计算思维对法学的冲击,如前所述,此种冲击的丰富性在于计算思维本身的多元内涵。从计算本身侧重宏观社会规律和个体思维来看,其与法学的结合具体表现为这两个问题,即“法律作为一种社会现象,其内在规律能否通过计算的方式加以把握”和“司法裁判作为特有的人类思维模式能否被计算的方式加以复现”。而要讨论这两个问题,则需要先讨论一些前置内容。
首先,如何界定“把握/复现”的标准或程度?就如有强弱人工智能一样,在讨论“法 律人工智能”时,“具法律通识能力的智能体”(Generalist Agent)是否该被视为讨论的对 象?就笔者看来,以目前的技术水准,尚无法实现一个能完全取代人类的机械智能体。但在算法模型的加持下,其足以在某些领域“以假乱真”。也正是因为有这些单点上的突破, 使得人类开始正视人工智能的问题。就此而言,讨论这些算法模型与人类思考方式在底层逻辑上的同异之处有助于我们把握这个问题。因此,问题的重点就不在于是否真的能“把握/复现”,而是技术思路中蕴含的可能性,即某些技术有没有可能达到实现“把握/复现”的目标。例如,因为机器学习技术的突破,当下在人工智能领域统计主义优于符号主义。但符号主义的发展方式也可能蕴含着下一个可能的突破,从而夺回人工智能技术的主导权。
其次,是对计算思维处理具体任务的理解。现已有了成熟的文本识别和语音转写技术, 并运用在司法审判中。但这些技术并非是本文的讨论对象,因为其实质上处理的是图像或 音符,仍旧是自然世界,而非人类思维。下文所欲引申的是法学研究/司法论证中计算对人 之思维的模仿。当然,关于模仿的具体层次,则可以根据数理水平的高低分成三类:(1)不同的方法与模型能解决何种问题,产生何种效益;(2)人工智能方法如何建模并选择合适的数据与算法来解决问题;(3)这些算法模型的限度有哪些,如何优化和突破。
最后,是有关法学研究/司法论证中人之思维具体内涵的讨论。考虑到文章主旨,并不 直接涉及法学界有关“法律人思维”的争议。而是假设这种思维存在,它是如何被呈现出来的。尽管正常人类有理性和非理性两种思考路径,但就法律人呈现的思维过程而言,其给出的研究判断或司法裁判往往要经过“法律理性”的包装(即便起点可能是非理性的)。这种“包装”包括使用法学术语、符合法律规范的逻辑、采用法律论证的结构等,并最终要就议题得出一个特定结论(往往是合法/非法的)。而计算的要点,就在于通过各种方式来模拟法学知识生产的过程。
在理解这些问题的基础上,我们一方面可以类推理解社会中的相关变化。如对判决文书的量化处理和对普通作品文档的量化处理在操作上是可以一致的,进而可以理解信息社会中所发生之许多新兴事物背后的机制,法学家、立法者、司法机关和法律服务行业(律师、律所)就可以对这些社会事实进行更精准的价值判断与取舍,从而反哺到立法规制的研究中去;另一方面,如何在法学研究和法律实践中运用这些技术,使泛化的大数据成为更精准的小数据,通用模型成为面向法律的定制模型,来将法律和科技更好的加以融合,则是另一个可供展开的问题链。以上,便是整个“法与计算”交叉研究问题域可供探索的疆域。
作者注:本文为基础文献的梳理,有关理论上进一步探索,可参见《法治社会》2024年第4期文章《计算思维与法学的“视域融合”》(含文献梳理的全文亦可参见笔者个人博客:https://www.carlshun.com/2024/08/14/ComputationalLaw/)
中国政法大学法思读书会
邮箱lawthinkers@163.com
欢迎关注|法律思想
编辑| 赵玉珍